Teorema del Límite Central para el Aprendizaje por Refuerzo Robusto Distribucionalmente Aproximado de Dos Escalas de Tiempo
Teorema del Límite Central en aprendizaje por refuerzo robusto con dos escalas de tiempo. Análisis de convergencia y estabilidad para entornos inciertos.